查看原文
其他

翻译技术|Linggle单语语料库的介绍与使用

李伟泽 翻译圈
2024-09-09


该书以解决翻译实践问题为导向,以多元化搜索技术为脉络,基于数百个典型案例和应用场景进行详细讲解,内容涵盖桌面搜索、文档搜索、词典搜索、术语库搜索、语料库检索、网络搜索以及学术搜索等多个方面,旨在系统提升广大翻译从业者的搜索素养。全书紧跟国家人工智能发展战略,基于数据驱动和数据赋能的理念,致力于将最新搜索技术与翻译工作需求深度融合,是国内首部聚焦译者“搜商”的著作。该书既适用于外语、翻译专业的师生,也适用于广大语言服务从业者、翻译爱好者及相关研究人员。

本文将分享第五章第一节 单语语料库中,台湾“清华大学”Linggle系统功能以及其如何应用。希望能够对大家有所帮助。它们分别是:


(一)系统介绍

(二)案例演示

1)如何进行模糊检索?

2)如何验证搭配是否地道?

3)如何根据词性检索搭配?

4)如何查找近义词?

目前该书可在各大购物平台购买,也可在微信阅读上免费阅读,欢迎大家一起阅读学习!


01

Linggle

(一)系统介绍

台湾“清华大学”Linggle系统是少数由学界开发且规模逼近业界搜寻引擎的特例。Linggle检索引擎是一个可用于英语翻译的语法工具和句子工具,可帮助译者根据词性来检索搭配,提高译文的丰富度和准确度。


 Linggle的基础界面

(二)案例演示




1.如何进行模糊检索?


(1)Linggle可以使用通配符''_''进行检索,该符号表示匹配一个单词,如输入''play a _ role'',检索结果如图6-22所示。


图6-22 在Linggle中检索''play a _ role''的结果


(2)还可输入多个''_进行''查询,如检索''from _to _'',检索结果如图6-23所示。''_''可以放在检索字段的任意位置,需要注意的是该功能最多只能检索五个词的词组,如检索''play an important role in _'',总词数为六个,为无效检索。


图6-23 在Linggle中检索''from _ to _''的结果


(3)还可以在检索词前添加问号,检索该词是否多余。以检索''discuss about the issue''中的介词''about''是否多余为例,检索框需输入''discuss ?about the issue''。检索结果如图6-24所示,''about''使用频率仅有0.1%,故该词为多余的介词。


图6-24 在Linggle中检索''discuss ? about the issue''的结果




2.如何验证搭配是否地道?



(1)Linggle中可以使用''/''来分隔多个比较词,并给出各个搭配的使用次数与比例。如检索''knowledge''应该搭配''learn'', ''study'', ''acquire''还是''gain'',检索框可以输入''learn/study/acquire/gain knowledge'';


(2)检索结果如图6-25所示,可以看出''gain knowledge''占比为62.3%,''acquire knowledge''占比为36.2%,而''learn knowledge''和''study knowledge''占比不足1%,所以应该使用''gain''或''acquire''比较地道,而不建议使用''learn''和''study''。


图6-25 在Linggle中检索''learn/study/acquire/gain knowledge''的结果


(3)点击''Example''下方的加号,可以显示关键词上下文,如图6-26所示。


图6-26 在Linggle的检索结果中查看语料




3.如何根据词性检索搭配?



(1)Linggle支持各种词性限定,而且检索格式简单,直接输入词性编码即可,如检索有哪些形容词可以修饰''greetings'',检索框输入''adj.greetings''即可,检索结果如图6-27所示。


图6-27 在Linggle中检索''adj. greetings''的结果


(2)词性符号也可以和分隔符号''/''一同使用,如检索''gather''可以接什么介词或副词,检索框输入''gather adv./prep.''即可,检索结果如图6-28所示。


图6-28 在Linggle中检索''gather adv./prep.''的结果


(3)Linggle更多词性编码可参照表6-4:


表6-4 Linggle的词性编码



4.如何查找近义词?



(1)在Linggle中查找近义词使用符号''~'',如检索''careful consideration''中careful的近义词,检索框需输入''~careful consideration'';检索结果如图6-29所示,除了''careful''还可以使用''proper''''thoughtful''''thorough''等词。




图6-29 在Linggle中检索''~careful consideration''的结果


以上就是本文的全部内容,欢迎大家阅读原书,共同学习!

- END -



翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!


原文作者:李伟泽

推文编辑:李姗姗

指导老师:朱华

核:吴志雄、刘一葶

项目统筹:吴志雄

资讯推荐


机器翻译译后编辑认知研究探析

▶精品课程

精品课程|(今晚开课)从入门到进阶:语料库建设与统计分析实务

精品课程|从入门到进阶:语料库建设与统计分析实务

新课来袭 | 开启倒计时!AI时代掀起影视字幕翻译的智能革命

▶资源宝库

翻译技术|提升 ChatGPT 翻译质量的简单 prompt

翻译技术|以Sketch Engine为船遨游语料海洋(二)

翻译技术|The Free Dictionary-多语在线词典搜索引擎

翻译技术|字幕翻译配音恐失业,Ai翻译配音超逼真

资源宝库|小鹤音形输入法——打字,你还能更快!

资源宝库|经济学人等160多家外刊免费看!

资源宝库|哈利波特1~8季大放送

▶翻译百科

翻译百科|《中国大百科全书》中的“翻译学”

翻译百科|《中国大百科全书》中的“神经网络机器翻译”

翻译百科|《中国大百科全书》中的“翻译层次”

翻译百科|《中国大百科全书》中的“范化”

翻译百科|《中国大百科全书》中的“可比语料库”

▶代码分享

翻译技术|代码分享——textblob情感分析

翻译技术|代码分享-提取三连词

翻译技术|代码分享——中文词云生成

翻译技术|代码分享——标准类符形符比

翻译技术|代码分享——清除符号

▶文献精读

文献精读|Explicitation in Neural Machine Translation

文献精读|Vanmassenhove:机器翻译中语言丰富性缺失

▶译界动态

译界动态|翻译公司—日本Honyaku Center简介

论坛预告 | 2023翻译技术与语言服务人才培养高端论坛

译界动态|2023“理解当代中国”多语种国际翻译大赛

译界动态|美国文学翻译协会 ( ALTA )简介

译届动态|公益沙龙之ChatGPT时代译者的搜商体系构建之道

  关注我们 了解更多

CATTI和MTI资讯

语言服务就业信息

翻译名师真知灼见

翻译学习精品课程


继续滑动看下一个
翻译圈
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存